草庐IT

Java http 客户端和 POODLE

全部标签

hadoop - 当客户端关闭连接时,Hadoop 如何处理未复制的数据?

我正在运行Hadoop2.5.0-cdh5.3.2集群。Flume正在别处运行,正在向这个集群写入数据。当集群负载较重时,flume-agent完成写入并尝试在HDFS完成数据复制之前关闭文件。关闭失败并重试,但flume-agent配置了超时,当关闭无法及时完成时,flume-agent断开连接。HDFS对没有完成复制的文件做了什么?我的印象是后台线程会完成复制,但我在我的集​​群中只看到部分写入的block。该block有一个好的副本,并且副本仅部分写入,因此HDFS认为该block已损坏。我已经通读了recoveryprocess没想到我会留下未写的block。我有以下客户端设置

javascript - Hive - Thrift - readMessageBegin 中缺少版本,旧客户端?

你好,我正在尝试构建一个nodejs客户端来使用thrift查询我的hive数据库,但我遇到了一个奇怪的问题......我已经用thrift生成了我的nodejs客户端API(thrift-r--genjs:nodeTCLIService.thriftTCLIService是定义Hive服务的节俭文件)现在我尝试连接到Hive但我的OpenSession正在等待中......也许我没有做正确的调用但我不在网上找不到任何最新的东西(每个thrift/node/hive项目都有4或5年的历史)。你能看看我做错了吗?谢谢TCLIService.thrift://OpenSession()//

C# Socket通信从入门到精通(14)——多个异步UDP客户端C#代码实现

前言:在之前的文章C#Socket通信从入门到精通(13)——单个异步UDP客户端C#代码实现我介绍了单个异步Udp客户端的c#代码实现,但是有的时候,我们需要连接多个服务器,并且对于每个服务器,我们都有一些比如异步发送、异步接收的操作,那么这时候我们使用之前单个异步Udp客户端的代码的话就会重复写很多代码,而且越多的客户端,重复的代码越来越多,因此有必要将多个异步UDP客户端的c#代码封装到一个类中,在本文中就是UdpClientASyncTool这个类,这样不论面对多少服务器,我们使用的代码都是同一套,增强了代码的可读性以及复用性,(如需源码,订阅专栏后加入文章底部qq群获取),demo软

hadoop - 在集群部署模式下运行 spark 提交作业失败但通过客户端

EDITI:通过删除应用程序中“setMaster”的conf设置,我能够成功运行yarn-cluster-如果有人可以帮助sparkmaster作为集群部署-那太棒了我正在尝试在本地测试机上设置spark,以便我可以从s3存储桶中读取数据,然后写回它。使用客户端运行jar/应用程序工作正常,很好,很好,因为它进入存储桶并创建一个文件并再次返回。然而,我需要它在集群模式下工作,以便它更接近我们的生产环境,但它总是失败——我能看到的日志中没有真正有意义的消息,也没有什么反馈可以继续。非常感谢任何帮助-我是spark/hadoop的新手,所以可能忽略了一些明显的事情。我也尝试以yarn-c

hadoop - Spark 提交,客户端无法通过 :[TOKEN, KERBEROS 进行身份验证];

我用kerberos设置了hadoop集群,但是当我运行spark-submit时,它抛出了异常。17/10/1908:46:53WARNscheduler.TaskSetManager:Losttask0.0instage0.0(TID0,192.168.92.4,executor1):java.io.IOException:Failedonlocalexception:java.io.IOException:org.apache.hadoop.security.AccessControlException:Clientcannotauthenticatevia:[TOKEN,KER

java - 无法使用 Java 客户端 API 扫描 Hbase 中的表

我正在尝试扫描Hbase中的表并检索其中的所有记录。这是我用来扫描表格的方法。我使用Maven构建项目。publicvoidgetAllRecord(StringtableName){try{HTabletable=newHTable(configuration,tableName);Scans=newScan();ResultScannerss=table.getScanner(s);for(Resultr:ss){for(KeyValuekv:r.raw()){System.out.print(newString(kv.getRow())+"");System.out.print(

hadoop - 如何使用 hdfs 客户端连接到远程数据节点?

我的目标是从hdfs下载文件到本地文件系统。我正在使用连接到远程HDFSNameNode的客户端。hadoopfs-gethdfs://sourceHDFS:8020/path_to_file/file/path_to_save_file我得到了一个异常(exception)。15/03/1712:18:49WARNclient.ShortCircuitCache:ShortCircuitCache(0x11bbad83):failedtoload1073754800_BP-703742109-127.0.0.1-139845939166415/03/1712:18:49WARNhdf

rest - 如何从 REST 客户端使用后缀 glob 从 HBase 检索多行?

我在名为test的HBase表中有以下行ROWCOLUMN+CELLrow1column=cf:a,timestamp=1429204170712,value=value1row2column=cf:b,timestamp=1429204196225,value=value2row3column=cf:c,timestamp=1429204213427,value=value3我正在尝试使用SuffixGlobbing检索行键匹配前缀row的所有行,如前所述here但为什么当我尝试http://localhost:8080/test/row*wherelocalhost:8080时,我

hadoop - 客户端使用哪个配置文件连接到 hadoop 集群

当边缘节点有多个hadoop分布时,可以有多个配置文件分散在目录中。在那些情况下,如何知道客户端正在引用哪个配置文件,以便它连接到集群。(比如说,对于Yarn)。一种选择是查看.bashrc文件以查明是否设置了HADOOP_HOME变量。是否有任何其他选项可以找出这一点。(很明显,使用find命令来搜索文件是不能解决目的的)。 最佳答案 Hadoop提供classpath命令。阅读以下命令的说明:classpathprintstheclasspathneededtogettheHadoopjarandtherequiredlibra

java - 无法将 Java 客户端连接到远程计算机中的独立 HBase 设置

我使用的是HBase.1.1.2版本。我能够通过HbaseShell以及HbaseRESTAPI完成所有工作。我有一个带有Ubuntu的VMWare,其中配置了Hadoop和Hbase,我正在从我的Windows机器上执行Java程序。注意:-我没有安装单独的zookeeper我正在使用Hbase内置的zookeeper。JPS输出:-3824SecondaryNameNode4194NodeManager7154HMaster9092Jps3300NameNode3510DataNode3975ResourceManager下面是我的Hbase-site.xml:-hbase.roo